珍藏|最简单的热图绘制工具+最全热图绘制工具
热图很重要,真的,这个大家都知道,这个不仅仅在计算表达量聚类的时候用得到,在评估测序数据质量的时候同样用得到,哪怕你在分析股票之间的关系的时候,也会用的热图。
但是
当我觅尽江湖,竟然没有发现一款绿色环保无污染,高端大气上档次的免费的热图绘制工具。
于是乎,小编就 ji ji ge 开发了一款图形化的热图绘制神器。
江湖规矩
先放下载链接,再放教程。
http://gap.shengxin.ren/tool/3/
或点击阅读原文直通
一本正经的教程讲解
1、首次登陆时,会提示注册邮箱,之后会生成一个文件,如下,以后可以将此文件复制到各个小程序的根目录下,就无需再注册啦!
2、双击运行主程序“HeatmapCluster.exe”,打开界面如下:
3、点击右侧“选择矩阵文件”(这里的矩阵文件为表达矩阵,对于行和列,无特殊要求,怎么开心怎么来)。这里,我们举例说明,矩阵文件如下所示(列名为sample,200例,行名为gene,11个):
4、瞬间生成Heatmap如下(具体运行时间根据您的电脑配置):
5、上面这个图很难看,并且很多参数需要调整,因此更改参数的选项如下:
6、更改颜色,点击这三个颜色框,可以随意选择颜色,这里举例说明选择蓝-白-红,三种颜色。
7、是否进行cluster?则选择“RowCluster”或者“ColCluster”。
8、是否进行Z-score?则选择按照Row还是Col进行Z变换,例子中,我们按照Row进行Z变换。
9、是否显示Row名字或者Col名字?则选择Show按钮。
10、选择聚类的方式?有“欧氏距离”和“皮尔森相关系数”两个选项。
11、调整完参数后,生成如下:
12、点击右侧保存相关按钮,建议保存为PDF格式,“绘图”按钮其实就是“刷新”功能啦!
13、最终保存的图像为下图(蓝-白-红):
【来自生信人的忠实粉丝分享_杭州薛之谦】
another其他工具:
1.小白不用R照样画热图
MeV可以应用于芯片数据及NGS数据分析。其单机版下载地址:
https://sourceforge.net/projects/mev-tm4/
同时他也具有在线版本供大家使用:
http://www.tm4.org/#/welcome
下面小编说一下单机版画热图过程
(1)选择数据格式:数据格式可以为为txt格式,具体内容如下图。就是一个基因在不同样本中的表达值了。
(2)软件运行。下载完毕解压后,点击下面的最后一个文件TEMV.bat文件,打开程序。
结果出现如下程序中间运行界面
最终主程序打开了
(2)数据导入:选择“File—>Load Data”,弹出“Expression File Loader”窗口。如下:
点击“Browse”按钮,打开你的表达量数据文件,出现如下界面:
(3)点击load后就出现下面热图了
(4)设置聚类参数:单击MeV主界面“Clustering”按钮,选择层次聚类(Hierarchical Clustering)。出现下面界面,选择相应参数(可以默认),单击“OK”按钮。
(5)展开窗口左侧的“HCL(1)”结点,点击层次聚类树(HCL tree)可查看不同基因表达谱及其聚类的信息。
聚类结果
(5)此外此软件还可以做差异表达分析,具体功能在Statistics中。
2. 热图太丑怎么办?
在基因的表达模式分析中,我们往往需要对多个基因表达数据进行可视化处理,使得我们所关注的基因在不同样本中表达情况一目了然。在日常研究中,我们往往习惯于选择热图实现这一基因表达模式可视化的需求,进而直观的表述我们的基因表达模式的分析结果。
今天就介绍一下非常简易使用的一个绘图包pheatmap
写在前面,准备一个表达谱矩阵,横轴为100个基因,纵轴为208个样本,如下:
biocLite("pheatmap")
然后加载
library(pheatmap)最简单的调用如下:
pheatmap(profile)pheatmap(log2(profile+1),breaks = bk)
此时看起来还不错,但是这个颜色有点不舒服,换个颜色试试
bk = unique(c(seq(-5,5, length=100)))pheatmap(log2(profile+1),breaks = bk
,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
看起来还行,但是从图中可以看到那个中间那条一长条全是白色,事实上我想看看一个基因在不同样本中的高低,所以我应该使用纵轴的zscore进行标准化一下
bk = unique(c(seq(-5,5, length=100)))pheatmap(log2(profile+1),breaks = bk,scale = 'column'
,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
pheatmap(log2(profile+1),breaks = bk,scale = 'column',show_rownames = F
,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
clust=pheatmap(log2(profile+1),breaks = bk,scale = 'column'
,show_rownames = F
,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
annotation_col = data.frame(
ClassGene = factor(paste0('Cluster',cutree(clust$tree_col,10)))
)
rownames(annotation_col) = colnames(profile)
pheatmap(log2(profile+1),breaks = bk,scale = 'column'
,show_rownames = F
,annotation_col = annotation_col
,color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
就写到这吧,还没有涉及的参数:
clustering_distance_rows = "correlation"#表示行聚类使用皮尔森相关系数聚类,当然也可以自定义如drows = dist(test, method = "minkowski");clustering_distance_rows = drows
cluster_row = FALSE#表示行不聚类
legend = FALSE#表示右侧图例不显示
display_numbers = TRUE#表示在热图中格子显示对应的数字,在那种横纵轴数目比较小是时候可用,比如样本间相关系数聚类
number_format = "\%.1e"#当显示数字时数字的显示方式
cellwidth = 15, cellheight = 12#表示热图中小方格的宽度和高度
fontsize = 8#表示热图中字体显示的大小
filename = "test.pdf"#表示直接就保存成test.pdf图片了
labels_row#可以自己定义横轴的显示字符,默认上图是基因名
main#类似title啦
gaps_col#产生一个间隔,就像有些文章中的那种分类后每个分类都有一个间隔。
3.本地绘制热图
绘制好看的热图(pheatmap)
pheatmap全称为pretty heamap;
pheatmap(mat, color = colorRampPalette(rev(brewer.pal(n = 7, name =
"RdYlBu")))(100), kmeans_k = NA, breaks = NA, border_color = "grey60",
cellwidth = NA, cellheight = NA, scale = "none", cluster_rows = TRUE,
cluster_cols = TRUE, clustering_distance_rows = "euclidean",
clustering_distance_cols = "euclidean", clustering_method = "complete",
clustering_callback = identity2, cutree_rows = NA, cutree_cols = NA,
treeheight_row = ifelse(cluster_rows, 50, 0),
treeheight_col = ifelse(cluster_cols, 50, 0), legend = TRUE,
legend_breaks = NA, legend_labels = NA, annotation_row = NA,
annotation_col = NA, annotation = NA, annotation_colors = NA,
annotation_legend = TRUE, drop_levels = TRUE, show_rownames = T,
show_colnames = T, main = NA, fontsize = 10, fontsize_row = fontsize,
fontsize_col = fontsize, display_numbers = F, number_format = "%.2f",
number_color = "grey30", fontsize_number = 0.8 * fontsize,
gaps_row = NULL, gaps_col = NULL, labels_row = NULL,
labels_col = NULL, filename = NA, width = NA, height = NA,
silent = FALSE, ...)
参数较多,但是直接用默认参数就能产生比较好看的热图了;下面以例子的形式给出pheatmap的一些重要参数的用法:
#首先构建一个矩阵用于测试:
test = matrix(rnorm(200), 20, 10)
test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3
test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2
test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 4
colnames(test) = paste("Test", 1:10, sep = "")
rownames(test) = paste("Gene", 1:20, sep = "")
#test为20行10列的矩阵:
#采取默认参数直接出图
library(pheatmap)
pheatmap(test)
#默认参数下是对行列均进行聚类(可设置cluster_row = FALSE, cluster_col = FALSE不进行行列的聚类;如果进行聚类了,还可以通过设置treeheight_row=0, treeheight_col=0不显示dendrogram),矩阵没有进行标准化(标准化参数为scale,可选"none", "row", "column"),热图的每个小块之间以灰色隔开(参数border_color,如果不想要border可以设置为NA,当然也可以设置成其它颜色),legend显示在右上方(可设置legend = FALSE不显示legend);热图的颜色可利用参数color调整;
#可自由设置legend的标签
pheatmap(test, cluster_row = FALSE, legend_breaks = -1:4, legend_labels = c("0",
"1e-4", "1e-3", "1e-2", "1e-1", "1"))
#在legend上的-1~4的位置显示"0", "1e-4", "1e-3", "1e-2", "1e-1", "1"
#可设置参数display_numbers将数值显示在热图的格子中,可通过number_format设置数值的格式,较常用的有"%.2f"(保留小数点后两位),"%.1e"(科学计数法显示,保留小数点后一位),number_color设置显示内容的颜色:
pheatmap(test, display_numbers = TRUE, number_format = "%.2f", number_color="purple") #"%.2f"表示保留小数点后两位
pheatmap(test, display_numbers = TRUE, number_format = "%.1e") #"%.1e"表示以科学计数法表示,保留小数点后一位
#还可以自己设定要显示的内容;
pheatmap(test, display_numbers = matrix(ifelse(test > 5, "*", ""), nrow(test)))
#pheatmap还提供了参数设置每个格子的大小
pheatmap(test, cellwidth = 15, cellheight = 12, main = "Example heatmap", fontsize = 8, filename = "test.pdf") #main可设置热图的标题,fontsize设置字体大小,filename可直接将热图存出,支持格式png, pdf, tiff, bmp, jpeg,并且可以通过width, height设置图片的大小;
#pheatmap还可以显示行或列的分组信息,支持多种分组;
annotation_col = data.frame(CellType = factor(rep(c("CT1", "CT2"), 5)), Time = 1:5)
rownames(annotation_col) = paste("Test", 1:10, sep = "")
annotation_row = data.frame(GeneClass = factor(rep(c("Path1", "Path2", "Path3"), c(10, 4, 6))))
rownames(annotation_row) = paste("Gene", 1:20, sep = "")
pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row)
#还可以自己设定各个分组的颜色
ann_colors = list(Time = c("white", "firebrick"), #连续数值型分组可设置成渐变
CellType = c(CT1 = "#1B9E77", CT2 = "#D95F02"),
GeneClass = c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 = "#66A61E"))
pheatmap(test, annotation_col = annotation_col, annotation_row = annotation_row,
annotation_colors = ann_colors)
#pheatmap还能够根据特定的条件将热图分隔开;
# cutree_rows, cutree_cols:根据行列的聚类数将热图分隔开;
pheatmap(test,cutree_rows=3,cutree_cols=2)
#还可以利用gaps_row, gaps_col自己设定要分隔开的位置
pheatmap(test, annotation_col = annotation_col, cluster_rows = FALSE, gaps_row = c(10, 14),
cutree_col = 2)
#可以设置labels_row, labels_col自己设定行或列的标签
labels_row = c("", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "Il10", "Il15", "Il1b")
pheatmap(test, annotation_col = annotation_col, labels_row = labels_row)
科研工具/资料:
科研软件、生信书籍应有尽有......
科研进展、热点资讯,穿梭科研内外
① BMJ:多喝全脂牛奶,或可降低高血压、糖尿病及代谢综合征的患病风险
期刊解读、生信
BioMan
BioMan主要报道生命科学领域热点资讯、解读前沿进展、分享科研资料。我们组建了10余个交流群,欢迎大家进群交流。添加公众号博主微信:mBioMan(下方二维码),邀你进群。温馨提示:添加管理员时,请备注一下研究方向+单位/学校!